科研星球

用t检验时的这些常见错误

两组独立样本有哪些检验方法?


数据分析包括两个部分,一个是统计描述,另一个是假设检验。对于统计描述,如果数据服从正态分布,则描述均数和标准差。如果数据是非正态分布,则考虑进行数据转换,或直接采用中位数和四分位数间距进行描述。

 

假设检验包括t检验、Z检验和Mann-Whitney U检验(秩和检验)等。当数据服从正态分布时,小规模抽样样本适合用t检验,大样本和总体样本适合用Z检验。如果数据不服从正态分布,则用Mann-Whitney U检验(秩和检验)。


注意:假设检验方法的选择其实与统计描述是对应的,切忌张冠李戴。


0.png


独立样本t检验与Mann-Whitney U检验

是否分清了t检验的类型?

常用的t检验包括单样本t检验、独立样本t检验和配对样本t检验。它们都是对样本均数(或样本差值的均数)进行统计推断。


0 (1).png

 

两独立样本t检验

两独立样本t检验需要满足以下条件:有且只有两组;连续性变量;独立性;正态性;方差齐性。

 0 (2).png


独立性

两种不同的方法获取100份活检组织。第一种方法是选取100个人,进行1次活检,每人取一份组织。第二种方法是选取1个人,进行10次活检,每次活检取10份组织。第一种方法获取的100份样本来自不同的人,样本间互相独立;而第二种方法获取的100份样本来自同一个人的不同组织,样本必然有相关性,不符合独立性要求。

0 (4).png

 

方差齐性

两独立样本t检验分析的数据通常服从正态分布。正态分布有两个重要的参数,均数和标准差(标准差平方以后就是方差)。既然数据的特征具有两个维度,一个是均数,即平均水平,另一个是方差,即离散水平,那么当进行数据分析时,可以采用控制变量法。例如,左图方差相同,比较均数即可;右图方差不同,均数也不一样,直接比较有点困难,此时需要采用校正t检验。


0 (3).png

 

Mann-Whitney U检验

当数据为非正态分布、转换后仍非正态、或者分布未知时,采用非参数检验,比如Wilcoxon符号秩和检验和Mann-Whitney U检验。

 

Mann-Whitney U检验是一种非常重要的非参数检验,具有以下特点:不需要假定数据符合某种分布(也适用于正态分布资料);适用于等级资料。

 

虽然数据服从正态分布和不服从都可以采用非参数检验,但当数据服从正态分布时,采用非参数检验会损失原始数据的信息,从而降低检验统计功效(power)。因此,当满足参数检验的要求时,尽量采用参数检验。

 

参数检验 vs. 非参数检验

参数检验,要求严格,数据信息得到充分利用。要求样本数据来自正态分布的总体,利用样本对未知总体参数做出推断;满足各组数据方差相等条件;常见的有t检验、方差分析。

 

非参数检验,适用范围广,但可能损失数据信息。对总体分布类型不做要求(因此也被称作“任意分布检验”);一端或两端无界、少量异常值的小样本数据、等级资料数据等也可用;适用性强,但可能增加Ⅱ类错误;常见的有:两独立样本秩和检验、 Wilcoxon符号秩和检验。

 

选择参数检验与非参数检验时,如果数据满足条件,则首选参数检验。当数据分布未知时,Mann-Whitney U秩检验更适合;但当两组数据服从正态分布(或能转换为正态)且满足其它适用条件时,独立样本t检验比Mann-Whitney U检验统计功效(power)更高。


没有账号?